library(tidyverse)
library(janitor)
library(dplyr)
library(lubridate)
library(readxl)
library(forecast)
library(seasonal)
library(plotly)
a) O excel continha 2 linhas de tÃtulos para as colunas, foi necessário ler o xlsx sem a primeira linha, utilizando o parametro range do read_excel.
data <- readxl::read_excel("www/retail.xlsx", col_names = TRUE, range = "A2:GH383") %>%
janitor::clean_names() %>%
rename(date = "series_id")
b)
grocery_market.ts <- data %>%
select(c("a3349335t") ) %>%
ts(
start = c(
lubridate::year(dplyr::first(data$date)),
lubridate::month(dplyr::first(data$date))),
end = c(
lubridate::year(dplyr::last(data$date)),
lubridate::month(dplyr::last(data$date))),
frequency = 12
) %>%
.[,1]
c) É possÃvel perceber uma grande sazonalidade, com novembro/dezembro sendo os meses que Supermercados e Lojas de Conveniência têm maiores vendas, pouco ciclo e tendência linear positiva ao longo dos anos.
d) Com o plot da decomposição da Time Series é possivel perceber que em 2009 houve um pico de vendas nos Supermercados e Lojas de Conveniência em New South Wales, na Austrália.
data_x11 <- seasonal::seas(grocery_market.ts, x11 = "")
data_x11 %>% autoplot() + ggtitle("X11 Decomposition Supermarket and Grocery Stores Time Series")
plot(data_x11)